神经网络的量化与图优化

探讨编译器前端如何将浮点数(FP32)模型转换为定点数(INT8/INT4)模型,减少内存占用并适配没有 FPU 的边缘设备。

Last modified: 2026-05-24